Outil de classification et de visualisation de grands volumes de données mixtes

نویسندگان

  • Christophe Candillier
  • Noureddine Mouaddib
چکیده

Résumé. Nous avons conçu un outil de classification de données original que nous détaillons dans le présent article. Cet outil comporte un module de création de résumés et un module d’affichage. Le module de création de résumés prend en charge les données mixtes (qualitatives et quantitatives) ainsi que les grands volumes de données en utilisant une méthode de classification incrémentale et agglomérative originale. Le module de visualisation permet une lecture aisée des résumés grâce à une interface graphique évoluée permettant la présentation et l’exploration des résumés sous forme d’une hiérarchie de profils ou d’un tableau de profils. Chaque profil donne de manière claire les informations importantes relatives au résumé de données correspondant. La lecture de la hiérarchie et du tableau est aussi grandement facilitée par le choix d’un ordre optimal pour la présentation des variables et des résumés.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

SVM et visualisation pour la fouille de grands ensembles de données

Résumé. Nous présentons un algorithme de SVM et des méthodes graphiques pour le traitement de grands ensembles de données. Pour pouvoir traiter de tels ensembles de données, nous utilisons une représentation des données de plus haut niveau (sous forme symbolique). L’algorithme de séparateur à vaste marge (SVM) est adapté pour pouvoir traiter ce nouveau type de données. Nous construisons un nouv...

متن کامل

Modèles de mélanges topologiques pour la classification de données catégorielles et mixtes

Résumé. Cet article présente une méthode basée sur les cartes auto-organisatrices probabilistes dédiées à la classification non supervisée et la visualisation de données catégorielles et des données mixtes contenant des composantes quantitatives et binaires. Pour chacun de ces types de données, nous proposons un formalisme probabiliste dans lequel les unités de la carte topologique sont représe...

متن کامل

Visualisation de données textuelles et inférence statistique

Les principaux outils de visualisation de données multidimensionnelles sont d’une part les analyses en axes principaux, qui portent des noms divers mais qui sont presque toutes fondées sur la décomposition aux valeurs singulières, et d’autre part les méthodes de classification, incluant les cartes auto-organisées de Kohonen. Ces deux familles d’outils sont d’ailleurs complémentaires, et leur us...

متن کامل

Approche biomimétique coopérative pour la visualisation de grands graphes multidimensionels

Face à la quantité sans cesse grandissante de données stockées, les algorithmes de fouille et de visualisation de données doivent pouvoir être capable de traiter de grandes quantités de données. Une des solutions est d’effectuer un prétraitement des données permettant la réduction de la dimension des données sans perte significative d’informations. L’idée est donc de réduire l’ensemble de descr...

متن کامل

Visualisation interactive multi-échelle des grands graphes. Application à un réseau de blogs

Résumé. De nombreux réseaux du monde réel peuvent être modélisés par des grands graphes. Réduire la complexité d’un graphe de manière à ce qu’il puisse être facilement interprété par l’œil humain est une aide précieuse pour comprendre et analyser ce type de données. Nous proposons une méthodologie de visualisation interactive multi-échelle de grands graphes basée sur une classification des somm...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2005